智能论文笔记

Sources of Noise in Dialogue and How to Deal with Them

Derek Chen , Zhou Yu

分类：自然语言处理

2022-12-06

Training dialogue systems often entails dealing with noisy training examples and unexpected user inputs. Despite their prevalence, there currently lacks an accurate survey of dialogue noise, nor is there a clear sense of the impact of each noise type on task performance. This paper addresses this gap by first constructing a taxonomy of noise encountered by dialogue systems. In addition, we run a series of experiments to show how different models behave when subjected to varying levels of noise and types of noise. Our results reveal that models are quite robust to label errors commonly tackled by existing denoising algorithms, but that performance suffers from dialogue-specific noise. Driven by these observations, we design a data cleaning algorithm specialized for conversational settings and apply it as a proof-of-concept for targeted dialogue denoising.

translated by 谷歌翻译

Sparse SPN: Depth Completion from Sparse Keypoints

Yuqun Wu , Jae Yong Lee , Derek Hoiem

分类：计算机视觉

2022-12-02

Our long term goal is to use image-based depth completion to quickly create 3D models from sparse point clouds, e.g. from SfM or SLAM. Much progress has been made in depth completion. However, most current works assume well distributed samples of known depth, e.g. Lidar or random uniform sampling, and perform poorly on uneven samples, such as from keypoints, due to the large unsampled regions. To address this problem, we extend CSPN with multiscale prediction and a dilated kernel, leading to much better completion of keypoint-sampled depth. We also show that a model trained on NYUv2 creates surprisingly good point clouds on ETH3D by completing sparse SfM points.

translated by 谷歌翻译

Interpretable Fake News Detection with Topic and Deep Variational Models

Marjan Hosseini , Alireza Javadian Sabet , Suining He , Derek Aguiar

分类：自然语言处理

2022-09-04

社会对社交媒体的依赖不断增长，用户为新闻和信息产生的内容增强了不可靠的资源和虚假内容的影响，这使公众讨论并减少了对媒体的信任。验证此类信息的可信度是一项艰巨的任务，容易受到确认偏见的影响，从而开发了算法技术以区分假新闻和真实新闻。但是，大多数现有的方法都具有挑战性的解释，使得难以建立对预测的信任，并在许多现实世界中（例如，视听功能或出处的可用性）做出不现实的假设。在这项工作中，我们专注于使用可解释的功能和方法对文本内容的虚假新闻检测。特别是，我们开发了一个深层的概率模型，该模型使用各种自动编码器和双向长期记忆（LSTM）网络（LSTM）网络与语义主题相关的特征从贝叶斯混合模型推断出来。使用3个现实世界数据集的广泛的实验研究表明，我们的模型可与最先进的竞争模型达到可比的性能，同时促进从学习的主题中解释模型。最后，我们进行了模型消融研究，以证明整合神经嵌入和主题特征的有效性和准确性是通过在较低维嵌入中可分离性评估性能和定性性来定量的。

translated by 谷歌翻译

Autonomous Passage Planning for a Polar Vessel

Jonathan D. Smith , Samuel Hall , George Coombs , James Byrne , Michael A. S. Thorne , J. Alexander Brearley , Derek Long , Michael Meredith , Maria Fox

分类：机器人

2022-08-17

我们介绍了一种考虑复杂的环境条件，在极地地区介绍了一种在极地地区长距离海上路线计划的方法。该方法允许构建优化的路线，描述了该过程的三个主要阶段：使用不均匀网格对环境条件进行离散建模，网格最佳路径的构建以及路径平滑。为了说明不同的车辆性能，我们构建了一系列数据驱动的功能，这些功能可以应用于环境网格，以确定给定容器和网格单元的速度限制和燃料要求，以图形和地理空间表示这些数量。在描述我们的结果时，我们展示了一个示例用途，用于Polar Research船RRS David Attenborough爵士（SDA）的路线规划，核算冰的性能特征，并验证韦德尔海地区的时空路线构建，南极洲。我们通过证明路线的变化取决于季节性海冰可变性，所使用的路线规划目标函数的差异以及其他环境条件（如电流）的存在来证明这种路线构建方法的多功能性。为了证明我们的方法的普遍性，我们在北极海洋和波罗的海中介绍了例子。本手稿中概述的技术是通用的，因此可以应用于具有不同特征的血管。我们的方法不仅可以拥有一个船只计划程序，而且我们概述了该工作流程如何适用于更广泛的社区，例如商业和乘客运输。

translated by 谷歌翻译

DICE: Data-Efficient Clinical Event Extraction with Generative Models

Mingyu Derek Ma , Alex Taylor , Wei Wang , Nanyun Peng

分类：自然语言处理 | 人工智能 | 机器学习

2022-08-16

临床领域中的事件提取是一个探索较少的研究领域。除了大量的特定领域的行话外，缺乏培训数据，包括较长的实体，具有模糊的边界，使该任务尤其具有挑战性。在本文中，我们介绍了DICE，这是一种用于临床事件提取的强大而数据效率的生成模型。骰子框架事件提取作为有条件的生成问题，并利用域专家提供的描述来提高低资源设置下的性能。此外，DICE学会了与辅助提及的识别任务一起定位和约束生物医学提及，该任务与事件提取任务共同培训，以利用任务间的依赖性，并进一步纳入确定的提及作为其各自任务的触发和论证候选者。我们还介绍了MacCrobat-EE，这是第一个带有事件参数注释的临床事件提取数据集。我们的实验证明了在临床领域的低数据设置下骰子的鲁棒性，以及将柔性关节训练并提及标记纳入生成方法的好处。

translated by 谷歌翻译

Understanding a Robot's Guiding Ethical Principles via Automatically Generated Explanations

Benjamin Krarup , Felix Lindner , Senka Krivic , Derek Long

分类：人工智能 | 机器人

2022-06-20

机器人的持续开发使他们在人类环境中的更广泛使用。机器人更加信任，可以通过潜在的关键结果做出越来越重要的决策。因此，必须考虑机器人运行的道德原则。在本文中，我们研究了如何将对比性和非对抗性解释用于理解机器人行动计划的伦理。我们以现有的道德框架为基础，允许用户就计划提出建议并自动生成的对比解释。用户研究的结果表明，生成的解释有助于人类了解机器人计划的基础的道德原则。

translated by 谷歌翻译

Harmony: Overcoming the Hurdles of GPU Memory Capacity to Train Massive DNN Models on Commodity Servers

Youjie Li , Amar Phanishayee , Derek Murray , Jakub Tarnawski , Nam Sung Kim

分类：机器学习

2022-02-02

在过去的十年中，深度神经网络（DNNS）的规模成倍增长，只剩下那些具有大量基于数据中心的资源的人具有开发和培训此类模型的能力。对于可能只有有限的资源（例如，单个多GPU服务器）的研究人员的长尾巴的主要挑战之一是GPU内存能力与模型大小相比。问题是如此严重，以至于训练大规模DNN模型的内存需求通常可以超过单个服务器上所有可用GPU的总容量；这个问题只会随着不断增长的模型大小的趋势而变得更糟。当前依赖于虚拟化GPU内存的解决方案（通过向CPU内存交换/从CPU内存）会产生过多的交换开销。在本文中，我们提出了一个新的培训框架，和谐和倡导者，重新思考了DNN框架如何安排计算并移动数据以在单个商品服务器上有效地推动培训大规模模型的边界。在各种大型DNN模型中，Harmony能够将交换负载最多减少两个数量级，并在具有虚拟化内存的高度优化基线上获得高达7.6倍的训练吞吐量加速。

translated by 谷歌翻译

Distributed Evolution Strategies Using TPUs for Meta-Learning

Alex Sheng , Derek He

分类：神经与进化计算 | 人工智能 | 机器学习

2022-01-01

元学习传统上，传统上依赖于整个任务来迭代改善模型的学习动态。但是，当缩放到复杂任务时，这种方法是在计算上难以解决的。我们使用张量处理单元（TPU）提出了一种分布式进化元学习策略，该张量处理单元（TPU）非常平行，可扩展到任意长的任务，内存成本没有增加。使用在Omniglot DataSet上进行的原型网络培训，我们在5次分类问题上实现了98.4％的准确性。我们的算法使用的存储器多达40倍，而不是自动差异计算梯度，结果模型可实现高精度培训的等效物（99.6％）的1.3％内的精度。我们观察到更高的分类准确性高达99.1％，人口配置较大。我们进一步通过实验验证了跨各种培训条件的ES-Protonet的稳定性和性能（不同的人口大小，模型规模，工人数量，射击，方式，es upperameters等）。我们的贡献是双重的：我们在监督环境中提供了对进化元学习的第一次评估，并为TPU的分布式演进策略创建了一般框架。

translated by 谷歌翻译

Non-invasive hemodynamic analysis for aortic regurgitation using computational fluid dynamics and deep learning

Derek Long , Cameron McMurdo , Edward Ferdian , Charlene Mauger

分类：计算机视觉

2021-11-23

心血管血流动力学的变化与主动脉反流（AR）的发展密切相关，一种瓣膜心脏病。源自血液流量的压力梯度用于表示AR发作并评估其严重程度。可以使用四维（4D）流磁共振成像（MRI）来非侵入地获得这些度量，其中精度主要取决于空间分辨率。然而，分辨率不足通常由4D流动MRI和复杂的AR血流动力学的限制产生。为了解决这个问题，将计算流体动力学模拟转化为合成4D流动MRI数据，并用于培训各种神经网络。这些网络生成了超级分辨率，具有upsample因子的全场相位图像为4.结果显示速度误差，高结构相似度得分和从以前的工作的改进的学习能力。在两组体内4D流动MRI数据上进行进一步验证，并在去噪流量图像中展示了成功。这种方法呈现了以非侵入性方式全面分析AR血液动力学的机会。

translated by 谷歌翻译

Long-Range Route-planning for Autonomous Vehicles in the Polar Oceans

Maria Fox , Michael Meredith , J. Alexander Brearley , Dan Jones , Derek Long

分类：机器人 | 人工智能

2021-10-30

对于在极地冰条件下运行的试点的自主水下车辆（AUV）的需求越来越大。目前，AUVS从船舶部署，并直接在这些区域中驾驶，含有高碳成本并限制运营范围。长期自治任务的关键要求是一种远程路线规划能力，了解变化的冰条件。在本文中，我们解决了在南海运行的AUV自动化远程路线规划问题。我们介绍了路线规划方法和结果，表明可以计划高效，冰避免的长距离遍历。

translated by 谷歌翻译